3.6.9.8 hmfma-半精度行列ベクトル積和演算の基本動作
code:文法
hmfma $l(x|y) <src_x> <src_y> <dst_0> <dst_1>.. 第 1 入力の$l(x|y)は読み出し元の行列レジスタであり、以下効果においてsideとして参照する。 第 2 入力の<src_x>および第 3 入力の<src_y>は読み出し元PEオペランドである。 <dst_0> [<dst_1>..]は書き込み先PEオペランドである。 演算結果は複数のPEメモリに同時に書き込むことができるが、以下効果では簡単のため単一の書き込み先としてdstを指定した例を示している。 code:効果.py
for cycle = 0:4
forall chip,l2b,l1b,mab
ShortWord dst_data16 = {0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0} for i= 0:16
for j = 0:16
forall pe